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基于 时 间 序 列 与 BP-ANN 的 短 时 交通 流速 度 预 测 模型 研究 


田 瑞 杰 ， 张 维 石 ， 翟 华 伟 


(大 连 海事 大 学 信息 科学 技术 学 院 , 辽宁 大 连 116026) 


摘 38. 短 时 交通 流速 度 预测 被 认为 是 智能 交通 系统 的 重要 组 成 部 分 ， 预 测 模型 的 准确 性 在 一 定 程度 上 决定 了 实时 交 
通 控制 和 管理 的 性 能 。 针 对 现 有 的 交通 流速 度 预 测 模 型 使 用 唯一 数据 集 且 模型 单一 的 问题 ， 提 出 一 种 时 间 序 列 与 人 工 
神经 网 络 相 结合 的 预测 模型 。 该 模型 通过 时 间 序 列 分 别 对 实时 数据 和 历史 数据 建 模 预测 ， 并 应 用 人 工 神 经 网 络 调整 实 
时 数据 和 历史 数据 的 预测 值 。 实 验 结果 表明 该 预测 模型 能 够 将 预测 误差 控制 在 7% 以内， 且 能 够 对 不 同 输入 参数 下 的 
短 时 交通 流速 度 进行 有 效 预测 。 

关键 词 : 时 间 序 列 ; 人 工 神经 网 络 ; 短 时 预测 ; 交通 流速 度 

中 图 分 类 号 : TP391.9 doi: 10.3969/j.issn.1001-3695.2018.06.0308 


Short-term traffic flow velocity prediction model based on time series and BP-ANN 
Tian Ruijie, Zhang Weishi, Zhai Huaweif 
(Information Science & Technology, Dalian Maritime University, Dalian Liaoning 116026, China) 


Abstract: Short-term traffic flow velocity prediction is considered as an important part of the intelligent transportation system. 
The accuracy of the prediction model determines the performance of real-time traffic control and management to some extent. 


Aiming at the problem that the existing traffic flow velocity prediction model uses a unique data set and a single model, this 


paper proposes a prediction model combining time series and artificial neural network. The model predicts real-time data and 
historical data by time series, and uses artificial neural network to adjust the predicted values of real-time data and historical 
data. The experimental results show that the prediction model can control the prediction error within 7% and can effectively 
predict the short-term traffic flow speed under different input parameters. 


Key words: time series; artificial neural network; short-term prediction; traffic flow velocity 


0 引言 1 ”国内 外 相关 研究 
交通 预测 已 成 为 智能 交通 系统 中 的 一 个 重要 课题 sans 近年 来 关于 短 时 交通 流速 度 预测 产生 许多 研究 成 果 ， 研 究 


…， 其 在 日 常生 活 中 扮演 着 重要 角色 。 交 通道 路 预测 是 现在 人 ”方法 大 致 分 为 两 类 ， 即 参数 方法 和 非 参 数 方法 。 典 型 的 参数 方 
们 广泛 使 用 的 智能 车 辆 路 线 导 航 设备 、 电 子 地 图 等 工具 的 重要  ” 法 是 使 用 时 间 序 列 模型 ,例如 Lai 错误 ! 未 找到 引用 源 。 等 人 利 
功能 之 一 ， 特 别 是 短 时 交通 道路 预测 ， 通 过 对 道路 状况 进行 实 。 用 时 间 序 列 模型 和 线性 回归 模型 进行 高 速 铁 路 短期 客流 预测 ， 
时 预测 分 析 ， 导 航 或 电子 地 图 等 工具 能 够 帮助 使 用 者 尽 可 能 避 ”其 主要 贡献 是 将 两 种 模型 结合 起 来 ， 利 用 不 同 的 模型 处 理 不 同 
开 拥堵 路 段 ， 提 供 更 加 合理 和 多 样 的 出 行路 线 选 择 。 宏 观 交 通 ”的 数据 部 分 ， 通 过 最 小 绝对 值 方法 进行 整合 以 生成 最 终 的 预测 
运行 特性 指标 为 流量 、 密 度 和 速度 "5 ， 而 在 公交 车 道 。 模型， 从 而 提高 预测 精度 ， 但 本 文 主要 侧重 于 城市 交通 流速 度 
效益 评价 方面 ， 最 重要 的 评价 指标 包括 行程 车 速 、 通 道 客运 能 。 预测。 对 于 非 参数 方法 ，Moreno “en 等 人 采用 模糊 C- 
力 、 道 路 使 用 者 出 行 时 间 节 省 等 下 2 有 ,"， 因 此 本 文选 取 交 。 ”均值 聚 类 的 算法 对 道路 交通 流速 度 进行 估计 ， 对 接收 到 的 瞬时 
通 流 速度 指标 来 反映 公交 车 道路 状态 。 通 过 时 间 序 列 模型 来 分 ”速度 数据 进行 聚 类 划分 等 级 ， 然 后 得 到 一 个 隶属 度 矩 阵 与 聚 类 
析 时 序数 据 的 线性 相关 性 ， 并 将 预测 的 结果 结合 预测 范围 、 预 。 中 心 向 量 ， 最 后 获取 平均 速度 ， 该 研究 并 没有 考虑 公交 车 进出 
测 时 间作 为 人 工 神经 网 络 的 输入 来 完成 模型 的 分 析 预 测 。 站 时 的 车 辆 非 正常 行驶 的 瞬时 速度 变化 对 聚 类 结果 的 影响 ， 这 


= 


fi 


i 


收 稿 日 期 : 2018-06-18; 修 回 日 期 : 2018-0727 ”基金 项 目 : 中 央 高 校 基本 科研 基金 资助 项 目 (3132016308, 3132018197); 过 宁 省 自然 科学 基金 资助 
项 目 (20170520196) 

作者 简介 : 田 瑞 杰 《1992-)， 男 ， 山 西 忻州 人 ， 硕 士 研 究 生 ， 主 要 研究 方向 为 计算 机 软件 与 理论 ,智能 交通 、 大 数据 ; 张 维 石 (1962-), 3, i, F, 
主要 研究 方向 为 软件 工程 与 软件 理论 .交通 信息 系统 等 ， 惧 华 伟 (1979-)， 男 (通信 作者 )， 讲 师 ， 博 士 ， 主 要 研究 方向 为 软件 工程 与 软件 方法 学 、 智 能 交通 、 
大 数据 应 用 等 (zhw@dlmu.edu.cn). 


201 808.00079v1 


chinaXiv 


录用 稿 


会 严重 影响 预测 精度 。Cao PARAIRE 设计 了 基于 BP 神经 网 络 


的 城市 干道 交通 流 预测 ， 
在 估计 交通 


练 集 和 测试 集 ， 


该 研究 使 


j 历 史 数 据 作 为 神经 网 络 训 


流 时 ， 只 体现 出 道路 交通 


流 的 周期 


Chi 
田 瑞 杰 ， 等 : 关于 时 间 证 列 与 BPANN APAN RA 


(00A 


jy 合作 期 刊 ， 


— — 时 间 序列 模型 


预测 范围 
性 和 普遍 性 ， 并 没有 结合 实时 道路 状况 进行 分 析 ， 从 而 未 体现 iu = 
出 道路 交通 流 的 特殊 性 ， 数 据 单一 是 该 研究 模型 的 不 足 之 处 ， EE em) s 
JU, Zhang "rif. 指出 ， 神 经 网 络 模型 在 处 理 大 量具 有 we a 
非 线性 特征 的 历史 数据 时 具有 优势 ， 但 忽略 了 包括 数据 在 内 的 
对 此 ，Li 等 人 fs 设计 了 短期 交通 流 预测 模 图 1 TS-ANN 预测 模型 结构 
型 ， 该 模型 结合 了 ARMA 和 径 向 基 函 数 人 工 神 经 网 络 BP 网 络 通常 包含 一 个 输入 层 , 一 个 或 多 个 隐 含 层 和 一 个 输 
(RBF-ANN)， 利 用 ARMA 模型 对 交通 流 时 间 序 列 的 线性 分 量 出 层 。 相 邻 层 的 节点 彼此 连接 ， 并 且 仅 与 每 个 节点 连接 接收 前 
进行 建 模 ， 然 后 利用 RBF-ANN 模型 通过 ARIMA 模型 建 模 的 层 神 经 元 的 输入 ， 只 有 每 层 神 经 元 处 理 的 输入 信息 才能 成 为 
残 差 来 捕获 非 线 性 分 量 ， 但 缺点 是 该 研究 ie ed 输出 层 的 输出 。 
高 峰 段 的 交通 流 做 研究 ， 因 此 当 交 通路 况 处 于 高 峰 拥 堵 时 ， 腿 设 输入 层 ， 隐 含 层 和 输出 层 分 别 具 有 m 个 神经 元 , hh 个 
通 状况 的 急剧 改变 会 严重 影响 模型 的 预测 性 能 。 神经 元 和 个 神经 元 , 隐 舍 层 的 输入 和 输出 用 等 式 (1) 和 (2) 表 
综 上 ， 短 时 交通 流速 度 预测 存在 不 确定 性 较 强 和 规律 性 较 ” 示 ， 输 出 层 的 输入 和 输出 用 公式 (3) 和 和 (4) 表示。 

弱 等 一 系列 不 可 忽略 的 特点 ， 单 一 使 用 某 一 种 模型 进行 预测 计 1,2 w,*x b 12,3... m j 212,3...) (1) 
算 ， 很 难 进一步 提高 短 时 交通 流速 度 预测 的 准确 性 。 为 此 ， 本 y, = f, UG 712,3... h) Q) 
文 提 出 了 一 种 时 间 序 列 (time series) 与 人 工 神 经 网 络 (ANN) 相 结 1L, =} wy * y, +b, 212,3... I0 12,3... p) G) 
合 的 模型 time series-ANN (简称 TS-ANN), 以 克服 单一 模型 的 y, = f,(1,)(0=1,2,3,...,p) (4) 
局 限 性 ， 让 两 者 进行 优势 互补 ， 构 建 出 完善 的 短 时 交通 流速 度 Rr wi 表示 输入 层 和 隐 含 层 的 连接 权重 ，wo 表示 隐 含 层 和 
预测 模型 。 在 TS-ANN 下 预测 交通 流速 度 是 发 展 智能 城市 的 输出 层 的 连接 权重 ，xi 表示 输入 层 的 输入 值 ,站 和 五 分别 表示 
次 重要 尝试 。 隐 含 层 和 输出 层 的 输入 值 ， 记 和 bo 是 隐 含 屋 和 输出 层 的 阔 值 ， 
2 TS-ANN 模型 GAO 

用 的 激活 函数 是 tanh 或 sismod， 输 出 层 的 激活 函数 是 relu, 4H 

在 本 章 提出 TS-ANN 预测 模型 ， 图 1 显示 了 模型 的 结构 。 应 的 公式 如 下 : 

实时 数据 V sw={ vn V2， vs... Vm} 表示 路 段 平均 速度 (km/hn) 实 "mS 2 P T 
时 信息 ， 历 史 数 据 V jw={ vr V2，V3,…，Vn} 表 示 路 段 平 均 速 度 lee? 
(km/h) Ej EEE, DIWA V sw V ma 中 选取 一 个 子 集 
YS, veros IL Jens Viel 9o, Viera VGL Jon ME NETT " 
为 时 序数 据 进行 时 间 序 列 建 模 分 析 ， 从 而 预测 出 下 一 时 刻 路 段 f (x) = max(0, x) (7) 
的 平均 速度 ， 其 中 Vi 中 相 令 元素 时 间 间 隔 A t=1 分 钟 , Vi 中 相 在 算法 1 中 ， 首 先 随机 初始 化 权重 值 w BH b. ARTI 
SBIRI BA A =l 周 。 时 间 序 列 建 模 时 首先 对 时 序数 据 进 数 由 输入 层 、 隐 舍 层 、 输 出 层 节 点 个 数 决定 。 第 一 次 for 循环 
行 平稳 性 检验 ， 其 次 观察 自 相关 值 A4CF 和 偏 自 相关 值 PACF, 时 ， 分 别 对 实时 数据 和 历史 数据 进行 时 间 序 列 建 模 预 测 ， 两 个 
从 AR(p)，MA(q)，ARMA(p,q) 中 选择 最 满足 时 序数 据 的 模型 ， 模型 的 预测 结果 结合 预测 范围 和 预测 时 间 被 传 入 到 第 三 个 for 
进而 根据 赤 池 信息 准则 (41C), 施 瓦 效 准则 (SC),， 汉 南 - 奎 因 准则 循环 , 结合 预测 时 间 和 预测 范围 作为 ANN 模型 的 输入 , 输入 数 
(GOC) 确 定 滞 后 阶 数 P、 q 值 , 最 后 通过 检测 残 差 序 列 是 否 为 高 。 据 为 {V sas V sss time, PH}, 训练 ANN 模型 ,比较 神经 网 络 的 预 
斯 白 噪声 来 对 模型 进行 拟 合 检验 。 在 TS-ANN 模型 中 ， 预 测 范 测 结果 与 现实 世界 的 交通 数据 ， 计 算 损 失 函 数 并 应 用 反 向 传播 
弱 和 预测 时 间 被 认为 会 影响 预测 模型 的 预测 精度 (2.1.3 节 详 细 算法 来 学 习 参 数 ， 训 练 模型 在 算法 1 结束 时 返回 。 
讨论 ), 预测 范围 单位 是 分 钟 , 预测 时 间 为 当前 时 间 与 预测 范围 在 算法 2 中 ， 时 间 序 列 模型 用 于 生成 第 一 步 预测 结果 。 再 
之 和 , 由 于 本 文 的 预测 时 间 共 有 2 种 状态 为 高 峰 段 和 非 高 峰 段 ， 结合 预测 范围 和 预测 时 间作 为 第 二 步 预测 的 输入 ， 以 产生 
所 以 预测 时 间 设 置 为 fime "{1,2}，1 表示 高 峰 段 ，2 表示 非 高 TS-ANN 的 最 终结 果 ， 输 出 数据 格式 为 V in。 
峰 段 。 时 间 序 列 预测 值 Vyw，V ww 结 合 预测 范围 、 预 测 时 间作 算法 1 TS-ANN 模型 下 训练 ANN 
为 人 工 神经 网 络 的 输入 ，7TS-ANN 模型 中 人 工 神经 网 络 选用 BP 输入 : 实时 数据 集 V= (Vit) 


神经 网 络 。 


历史 数据 集 V= (Vj 


(2)} 


T=[t,...tmj，t 表示 


预测 范围 集 PH={h 


每 个 速度 信息 的 时 间 值 


ph2,..., ha] 
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Chi ve 
录用 稿 田 瑞 杰 ， 等 : 基于 时 间 序 列 与 BP-ANN ana iv (ER Db. 
输出 : ANN 训练 模型 L9004 (如 图 2) 上 二 个 月 公交 车 轨迹 数据 ， 时间 起 旋 点 为 2017 


始 : 初始 化 连接 权重 wwe R^", 
Cn 为 隐 含 层 神经 元 数量 ) 


for(k=1;k<m;k++) 


for(g=1;g<n;g++) 


使 用 V-(Vi(r) FI to di, hs 
预测 值 Vr; 


Vu: 


for(kz0;k«train num;k4 4) 


将 预测 值 Vr 
模型 ， 使 用 梯度 下 降 来 学 习 参 数 


训练 ANN 模型 ， 


rli RE 


Woi € m, BE b^ € R, b^e R! 


咱 模 型 建 模 产生 


使 用 Ve(V(t) RU hs 进行 时 间 序 列 模型 建 模 产 生 预 测 值 


Vn， 以 及 预测 时 间 、 预 测 范围 输入 到 ANN 


年 11 月 1 


日 至 2017 年 12 H 29 日 (每 天 上 午 6 点 至 晚上 9 点 )， 


时 间 间 隔 为 10 s， 对 应 的 4 个 路 段 的 路 程 分 别 为 0.84km. 


0.98km. 0.85km, 0.97km, R 1 为 部 分 轨迹 数据 。 
针对 采集 的 轨迹 数据 ， 
得 到 本 文 实 验 数 据 集 


V(t) ， 


使 用 路 段 平 均 速度 估计 算法 ， 从 而 
其 中 Vroco(t)- ( Vi(t), 


Vo(1)) 671,2,3,4), SCIRE. V1(1) 是 菜 天 某 时 刻 之 前 的 连续 pj 个 


时 刻 的 路 段 平均 速度 信息 ， 表 达 式 为 

vi (t) = {v(t —1), v(t — 2), ..., v(t 

历史 数据 VANÆRE Z 
段 平 均 速 度 信 息 ， 表 达 式 为 


pi)} 


v (t) 2 (v(t -7x24x1),v(t -7x24x2),..., v(t —7x24xp,)} 


表 1 ”轨迹 数据 示例 


(10) 
前 的 连续 pz 周 该 时 刻 的 路 


(11) 


使 用 损失 函数 评估 模型 的 性 能 coordinate 
carid speed/km/h heading course/km  datetime 
返回 : ANN 训练 模型 lon lat 
算法 2 TS-ANN 下 的 路 段 速度 估计 2017-11-1 
B001 121.589 38.93 10 134 0.8 
输入 : 实时 数据 集 V= {V(t} 7:25:20 
历史 数据 集 V= (Vj(t)) 2017-11-20 
B002 121.573 38.93 15 133 0.24 
预测 时 间 time 7:48:58 
预测 范围 PH 2017-12-10 
B001 121.570 38.98 11 358 0.07 
输出 : TS-ANN 模型 预测 结果 7:48:58 
始 : 初始 化 连接 权重 wwe R”, wae R", Bf be R", beeR! 
为 算法 1 的 输出 值 〈m 为 隐 含 层 神经 元 数量 ) 2017-12-29 
B002 121.598 38.91 32 85 0.67 
实时 数据 集 了 进行 时 间 序 列 建 模 产生 预测 值 Vr 7:25:20 
历史 数据 集 V 进行 时 间 序 列 建 模 产生 预测 值 Vi 表 中 : carid 表示 车 辆 编号 ; lon 表示 和 车辆 定位 经 度 ; lat 表示 和 车 
将 Vg, Vu, time, PH 输入 到 ANN 模型 辆 定位 纬度 ，speed 表示 和 车辆 瞬时 速度 ;heading 表示 车 辆 行驶 
计算 最 终 预测 结果 方向 ; 


返回 :预测 结果 


2.1 时 间 序 列 预 测 模型 


基本 模型 是 ARMA(p,q)， 表 达 式 为 


y= E oat PON 


(8) 


其 中 : Y(t=1,2,3...) 为 时 间 序 列 , 


型 参数 , 0 为 MA 模型 参数 , p 为 自 回 归 项 ， 
t 是 时 间 索 引 。ARMA(p,q) 是 
实 世 界 获得 的 时 序数 据 经 常会 呈现 出 系统 
势 ， 有 些 还 呈现 出 周期 性 波动 ， 这 样 的 时 


的 随机 过 程 ， 不 可 以 直接 使 用 ARMA(p,q) 建 模 分 析 。 对 于 非 平 


e 是 零 均 值 


WR, o 为 AR 模 
q 为 移动 平均 项 数 ， 


平稳 [x Ls gr RURSUS. 4H. 


生地 上 升 或 下 降 等 趋 
序数 据 产生 于 非 平稳 


稳 的 时 间 序 列 ， 首 先 应 用 差分 变换 将 其 
4RMA4(p,9g) 来 模拟 己 平 稳 化 的 随机 过 程 ，; 
动 平 均 模 


ey Gd - B! Y, = 6, (Ge; 


Hop: B 是 后 移 算 子 ， 其 中 BY,=Yi1/，d 是 
2.1.1 时 序数 据 集 构造 


型 ， 简 记 为 ARIMA(p,d,q), 表达 式 为 


F 稳 化 ， 然 后 再 使 用 
这 就 是 自 回 归 积 分 滑 
(9) 


本 文 从 大 连 市 交通 数据 库 获取 路 段 L9001, L9002, L9003， 


yr 


dcm 
t 


图 2 


2.1.2 时 间 序 列 模型 构建 


所 选 道路 位 置 


course a 与 上 一 站 距离 ; datetime 表示 数据 上 传 时 刻 。 


本 节选 取 路 段 L9007 的 实时 数据 Vi(t) 和 历史 数据 V2(t) 进 行 


实验 分 析 ， 部 分 输入 数据 如 表 2、3 所 示 。 
表 2 实时 数据 示例 


时 间 速度 (km/h) 
2017-12-29 6:30 43.6 
2017-12-29 6:31 42.4 
2017-12-29 6:32 45.7 
2017-12-29 9:59 31.3 
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到 引用 源 。 


录用 稿 
2017-12-29 10:00 28.7 
表 3 历史 数据 示例 
时 间 速度 (knvh) 
2017-12-29 8:00 30.4 
2017-12-22 8:00 26.5 
2017-12-15 8:00 27.1 
2017-12-8 10:00 31.2 
2017-12-3 10:00 28.6 


于 每 个 模型 ， 


别 设 


田 瑞 杰 ， 


3) 滞后 阶 数 选择 


使 用 AIC, SC, HOC 信息 准则 检验 ARMA AIMA EATR 
， 从 而 确定 滞后 阶 数 疡 dg WE. II p, q 的 取 值 区 间 建 立 
ARMA(2,2)、ARMA(2,1)、ARMA(1,2)、ARMA(1,1) 四 种 模型 ， 对 


共 进 行 三 次 模拟 实验 ， 每 次 实验 的 样本 数量 分 
为 40, 50, 60, 选择 三 
从 表 6 知 ， 选 择 ARMA(1,2) 作 为 最 终 模型 ， 因 为 它 具 有 最 小 的 
AIC. SC. HQC 值 ， 模 型 预测 效果 最 好 。 


次 实验 中 AIC. SC. HOC 的 最 小 值 。 


不 同 ARMA 模型 的 AIC SC HQC 


1) 单位 根 检验 


对 路 段 L9001 的 时 序数 ] 


如 表 4 Bp, 当 检 验 式 中 的 附加 项 为 
Ho:6=0 F, 单位 根 的 t+ 统 计量 的 值 为 -3.6492, 在 196, 596, 10% 


三 个 显著 性 水 平 下 ， 单 位 根 检 验 的 


-2.9211，-2.5985， 显 然 ， 
值 ， 从 而 拒绝 原 假设 Ho, 
模 分 析 。 


E V(t) 进 行 平稳 性 检验 千 呈 ! 末 开 到 引用 浙 . 


Intercept 时 ， 在 原 假设 


mi IE AT 3] 73 -3.5683 , 


5 检验 统计 量 值 小 于 相应 的 DW 临界 


表明 该 序列 是 


平稳 序列 ， 可 以 用 于 建 


表 4 o 单位 根 检验 信息 表 
t-Static 
Include in test 
ADF test Test critical values 
equation 
statistic 196 level 5% level 10% level 
None -1.3864 -2.6140 -1.9478 -1.6124 
Intercept -3.6492 -3.5683 -2.9211 -2.5985 
Trend and 
-3.7196 -4.1525 -3.5023 -3.1806 
Intercept 
2) 模型 选择 


观察 时 序数 据 Vi(t) 的 ACF/PACF，ACF 是 


有 特定 时 间 偏 


移 的 时 间 序 列 中 的 任何 两 个 值 之 


间 的 相关 性 ， 


Titi Ja (lag), 


PACF 起 


有 特定 滞后 的 任意 两 点 过 


[EJ ff ga pp Rename, qu 


SHE 


Ne 


了 模型 和 移动 平均 模型 的 定义 ， 可 以 确定 时 间 序 列 模型 
的 ACF/PACF 表现 ， 如 表 5 所 示 。 通 过 观察 ACF/PACF f 


E Ut 


择 模 型 的 参数 数量 ， 如 图 


3 所 示 ，ACF 表现 出 lag=2 


时 拖 尾 ， 


PACF 表现 出 lag=2 时 拖 尾 ， 所 以 初步 确定 该 模型 是 ARMA 模 
W, EH p 的 值 限定 在 区 间 [1,2]，g 的 值 限定 在 区 间 [1,2]。 
RS ”时 间 序 列 模型 ACF/PACF 表现 


AR(p) MA(q) ARMA(p,.q) 
ACF 拖 尾 q 阶 截 尾 拖 尾 
PACF pE 拖 尾 拖 尾 
Í t (380 | | I 了 


Partial Autocorrelation 


相关 和 偏 自 相关 分 析 


4 与 时 间 


Model AIC SC HQC 

ARMA(2,2) 6.895573 7.088580 6.968771 

ARMA(2,1) 7.020063 7474497 7.078665 

ARMA(1,2) 6.888170 7.041132 6.946418 

ARMA(1,1) 7.037046 7451767 7.080732 
PM rh 


— Residual — Acua — Fed 


4 模型 检验 


评估 模型 是 否 


S4 (MREZI) ACF 和 PACF (5b)ARMA(1,2) 预 测 值 和 实际 值 拟 合 


能 很 好 地 表示 时 间 序 列 ， 应 用 了 模型 检验 方 
。 该 模型 对 残 差 序 列 进行 相关 性 和 偏 自 相关 性 检验 ， 如 果 模 
序列 很 好 的 拟 合 
5 4(a)， 计 算 残 差 序 列 的 ACF 和 PACF 值 ， 根 据 滞后 的 阶 数 确 


， 则 残 差 部 分 表现 为 白 噪声 序列 。 如 


使 模型 


型 的 性 外 


BU PH»o, H 


评价 预测 的 ; 
ARMA(1,2) 模 型 


定 残 差 序列 已 为 


噪声 序列 。 图 4(b) 显 示 了 模型 预测 值 与 实际 


以 合 效果 ， 可 
氏 ， 猜 测 是 复杂 的 交通 
4 的 拟 合 性 能 下 降 。 重 复 以 上 步骤 ， 时 序数 据 V2(t) 采 用 
ARIMA(2,1,2) 模 型 。 

2.1.3 模型 分 析 


以 看 出 ， 在 进入 早 高 峰 


期 时 ， 拟 合 效 果 明 显 降 
状况 引起 交通 流速 度 的 急剧 变化 ， 从 而 


该 节 通 过 设置 不 同 预测 范围 (PC 画 和 预测 时 间 (tizxme) 对 模 
进行 分 析 研 究 。 
假设 1 当 预 测 范围 不 超过 一 定 阔 值 e. BB PE<p， 


4RM4(1,2) 模 型 预测 效果 更 为 准确 ， 当 预测 值 超过 一 
H ARIMA(2,1,2) 模 型 预测 效果 更 为 准确 。 


XE BREL p, 


如 图 5 所 示 ， 使 ) 


ETTE, 


有 更 好 的 预测 效果 。 然 而 ， 当 PE>5《〈 预 测 范 目 
did 5 分 钟 时 )，ARIMA(2,1,2) 模 型 开始 产生 更 好 的 预测 


平均 绝对 百分比 误差 MAPE (公式 12) 
当 PH<5 时 ( 即 预 测 范 围 小 于 5 分 钟 )， 


pu 


。 设 置 g=5， 假 设 1 成 立 。 
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me |X; -X 
MAPE =| — > ————— |x100% 
Mi X d ' d 


预测 次 数 。 


Predict Horizon ( min ) 


图 5 不 同 PH 下 模型 MAPE 值 对 比 


假设 2 ” ARIMA(2,1,2) 模 型 可 以 高 效 地 预测 高 峰 时 段 的 交 


通 流 速度 变化 ， 而 ARMA(1,2) 模 型 很 难 捕捉 道路 状态 急剧 变化 
特征 。 
* Actual 
60 ^ ARMA 
ARIMA 
soi US PON 
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404.4048, 
2 J t ao = 
EM A 
& i3 全 as 
a ada da or w "m 
20 + E C AA 
P As a 
104 ail Pe a 
* * 
村 
Sr 


SB Eg 
time 


图 6 实际 值 与 时 间 序列 模型 输出 结果 比较 
在 该 案例 中 ， 固 定 预测 范围 PH=5(g=5)， 图 6 描述 了 特定 
工作 日 不 同时 间 的 实际 速度 值 和 ARMA(1,2)、ARIMA(2,1,2) 的 预 
测 值 。 在 凌晨 6:50 左右 的 早晨 高 峰 期 ，ARIMA(2,1,2) 模 型 有 非 
常 小 的 错误 率 ， 而 ARMA(1,2) 会 在 一 些 时 间 点 上 发 生 明显 错误 
预测 。 同 样 ， 在 早上 9:05 左右 高 峰 时 段 边界 ，ARIMA(2,1,2) 还 
准确 地 预测 了 拥堵 后 的 速度 ， 而 ARMA(1,2) 明 显 产 生 较 大 的 误 
差 。 结 果 表 明 ， 在 高 峰 时 段 ，ARIMA(2,1,2) 的 预测 精度 比 
ARMA(1,2) 高 , 假设 二 成 立 。 
2.2 ANN 预测 模型 
2.2.1 BP 神经 网 络 

BP 神经 网 络 是 一 种 按照 误差 逆向 传播 算法 训练 的 多 层 前 
馈 神经 网 络 和 款 玉 到 下 ,*， 它 的 基本 思想 是 梯度 下 降 法 ， 利 用 梯 
度 搜索 技术 ， 以 期 使 网 络 的 实际 输出 值 和 期 望 输出 值 的 误差 均 
方差 为 最 小 。BP 神经 网 络 学 习 过 程 由 正 向 传播 和 反 向 传播 组 
成 ， 在 正 向 传播 过 程 中 ， 输 入 信息 从 输入 层 传经 隐 含 层 逐 层 处 
里 ， 并 转向 输出 层 ， 每 一 层 神经 元 的 状态 只 影响 层 神 经 元 
的 状态 ， 处 理 后 产生 一 个 输出 ， 并 获得 实际 输出 值 和 期 望 输出 
值 的 均 方 误差 。 如 果 在 输出 层 不 能 得 到 期 望 输出 值 ， 则 转 入 反 
向 传播 ， Mee zl c 通过 修改 各 神经 
元 的 权 值 ， 使 得 i 号 最 小 。 
2.22 BP 神经 网 络 建 模 步骤 

a) 确 定 网 络 结构 : 确定 网 络 层 ， 每 层 的 神经 元 数量 和 激活 


naA t 
dESGASUSSEANN UE 时 交通 流速 度 


经 网 络 由 输入 层 ， 隐 含 层 和 输出 层 组 成 ， 本 文选 取 V 
xw» Vs, time, PH 四 个 参量 作为 输入 层 ， 交 通 流速 度 作为 输 


出 层 ， 为 了 确定 隐 含 层 中 神经 元 的 数量 ， 实 验 选取 了 3 到 15 


神经 元 进行 实验 对 比 ， 选 取 4 个 路 段 11 月 1 日 至 12 H 22 
数据 作为 训练 集 ，12 月 23 日 至 12 月 29 日 的 数据 作为 测 


7 可 以 发 现 ， 具 有 12 个 隐藏 神经 元 的 BP 网 络 具有 
能 ， 所 以 ， 将 隐 含 层 节点 个 数 设置 为 12。 从 而 建立 4 个 
输入 节点 和 1 个 输出 节点 ，12 个 隐藏 神经 元 ， 隐 含 层 激活 函数 
为 Sigmod， 输 出 层 激 活 函 数 为 Relu 的 神经 网 络 来 进行 训练 和 
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隐 含 层 大 小 


图 7 不同 隐 含 层 大 小 的 神经 网 络 性 能 


b) 初始 化 隐 含 层 神经 元 阅 值 g， 答 出 层 神经 元 阔 值 6， 在 
Rif XR 


居 下 ， 设 置 最 小 误差 EE， 学 习 率 wn， 最 大 训练 次 


c) 根 据 输入 样本 计算 隐 含 层 输出 和 输出 层 输出 。 
dd) 计算 实际 输出 和 期 望 输出 的 均 方差 ， 如 果 误 差 值 满 足 要 
求 ， 则 结束 网 络 训 练 。 


1 之 
E= | 一 n—1»Y 1 
Eo 1) (13) 


羊 本 数量 ， yi 是 预测 值 ， HE 期 望 值 
调整 每 个 神经 元 的 权重 值 ， 通 过 重复 步骤 c)-e) f E 


HER. 


实验 结果 及 分 析 


在 该 模拟 实验 中 使 用 均 方 根 误差 作为 评价 指标 ， 如 式 (14) 


nus - |. $ ? 
- LEO 1 (14) 


UIS 


HP: 和 和 Yi 分 别 代 表 实 际 速度 和 预测 速度 ，n 代表 预测 的 次 


3.2 实验 对 比 及 分 析 

在 三 次 实验 中 PH 分 别 被 设 定 为 4，5，6。 当 PH=4 时 ， 
分 别 对 高 峰 段 和 非 高 峰 段 的 交通 流速 度 进行 预测 分 析 , 从 图 8(b) 
见 ， 在 非 高 峰 时 段 ，ARMA(1,2)、ARIMA(2,1,2) 和 
TS-ANN 的 预测 走势 总 体 一 致 ， 但 相 比 于 ARMA(1,2) 模 型 ， 
TS-ANN 能 更 好 反映 交通 流速 度 。 在 高 峰 时 段 ，ARIMA(2,1,2) 
能 够 更 地 拟 合 出 时 序数 据 的 线性 关系 ， 从 而 提高 预测 的 准 
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确 性 。 而 本 文 的 TS-ANN 较 ARIMA(2,1,2) 表 现 出 显著 的 预测 性 
能 , 但 实际 中 还 是 有 一 部 分 时 刻 的 交通 流速 度 没 能 很 好 的 预测 
到 。 未 能 预测 到 的 主要 的 原因 其 一 是 该 时 刻 点 处 于 高 峰 时 段 发 
生 和 结束 边界 ， 其 二 是 实验 中 使 用 的 原始 时 序数 据 有 限 ， 本 实 
验 只 使 用 了 二 个 月 的 交通 流速 度 信息 ， 如 果 能 采集 到 更 多 的 时 
序数 据 ， 则 能 更 好 的 拟 合 实际 值 。 

当 PH=6 时 ， 从 图 9(5) 发 现 ， 在 非 高 峰 时 段 ，ARMA(1,2)、 
ARIMA(2,1,2) 和 TS-ANN 的 预测 的 数据 走势 总 一 致 ， 且 
4R1M4(2,1.2) 比 ARMA(1,2) 的 预测 性 能 较 高 , 跟 假设 一 的 结果 一 
致 ， 但 是 并 没有 显著 性 的 差距 。 而 TS-ANN 能 更 好 的 显示 出 道 
路 的 真实 运行 速度 。 在 高 峰 时 段 时 ，ARMA(1,2) 模 型 的 拟 合 效 
果 最 差 ， 且 在 部 分 时 间 点 反映 出 较 大 的 预测 误差 , 而 本 文 的 
TS-ANN 的 预测 结果 最 准确 ， 在 高 峰 时 段 ，RMSE 最 低 可 达到 
4.35%. 
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图 9 ” 短 时 预测 性 能 对 比 (PH=6):(@) 高 峰 期 (5p) 非 高 峰 其 

当 PH=5 时 ,如 图 10 显示 出 不 同时 刻 真 实 值 与 预测 值 的 拟 
合 情 况 ， 可 以 看 出 ， 在 6:00 到 6:50 期 间 ，ARMA(1,2) 模 型 和 
TS-ANN 跟 实际 值 的 相似 程度 最 高 , 而 ARIMA(2,1,2) 模 型 在 部 分 
时 刻 出 现 较 大 的 计算 偏差 ， 比 如 在 6:15，ARIMA(2,1,2) 的 预测 
值 是 27.6km/h, 而 实际 值 为 43.6km/h。 在 6:50 左右 的 早 高 峰 时 
ARMA(1,2) 模 型 并 没有 捕捉 到 道路 的 真实 状态 ， 直 到 7:13 左右 
时 才 反映 出 道路 的 拥堵 状态 ， 而 TS-ANN. 用 非常 小 的 误差 率 预 
测 拥堵 的 开始 。 在 早 高 峰 结 束 时 ，7S-4NXN 也 成 功 预测 到 道路 
的 真实 状态 ， 结 果 表 明 ， 本 文 的 TS-ANN 在 短 时 交通 流速 度 预 
测 中 可 以 很 好 地 处 理 预测 范围 以 及 预测 时 间 的 影响 ， 模 型 具有 
一 定 的 适应 性 。 


pu 


ChinaXiv& 'ERBTII 
型 研究 


田 瑞 杰 ， 等 : 基于 时 间 序 列 与 BP-ANN 的 短 时 交通 流速 度 预测 模 


speed(km/h) 
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X 10 “不同 模型 预测 值 与 真实 值 比较 


结束 语 


交通 道路 的 变化 过 程 具有 复杂 性 和 不 确定 性 ， 单 纯 使 用 某 


一 种 模型 难以 得 到 满意 的 预测 结果 。 本 文 提出 一 种 城市 道路 交 


通 流速 度 预测 模型 ， 该 模型 充分 使 用 了 时 间 序 列 模型 和 人 工 神 
经 网 络 在 线性 和 非 线性 建 模 的 优势 ,在 可 预测 性 分 析 的 基础 上 ， 
分 别 在 实时 数据 和 历史 数据 中 选取 一 组 时 序数 据 进 行 时 间 序 列 


建 模 预 测 ， 对 二 者 的 预测 值 通过 BP 神经 网 络 进行 融合 调整 ， 
从 而 得 到 最 终 的 预测 结果 ， 在 一 定 程度 上 改善 了 短 时 交通 流速 
度 的 预测 效果 。 但 本 文 并 未 考虑 到 天 气 和 突 发 事件 等 因素 对 路 
段 速度 的 影响 ， 因 此 对 该 类 因素 的 分 析 将 是 本 文 下 一 步 的 主要 
研究 工作 。 
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